AI资讯新闻榜单内容搜索- DeepSeek-

为什么 DeepSeek 大规模部署很便宜，本地很贵

为什么 DeepSeek-V3 据说在大规模服务时快速且便宜，但本地运行时却太慢且昂贵？为什么有些 AI 模型响应很慢，但一旦开始运行就变得很快？

来自主题: AI技术研报

9817 点击 2025-07-08 11:14

对谈 DeepSeek-Prover 核心作者辛华剑：Multi Agent 天然适合形式化数学｜Best Minds

Era of Experience 这篇文章中提到：如果要实现 AGI，构建能完成复杂任务的通用 agent，必须借助“经验”这一媒介，这里的“经验”就是指强化学习过程中模型和 agent 积累的、人类数据集中不存在的高质量数据。

来自主题: AI资讯

8757 点击 2025-06-14 12:58

1.93bit版DeepSeek-R1编程超过Claude 4 Sonnet，不用GPU也能运行

1.93bit量化之后的 DeepSeek-R1（0528），编程能力依然能超过Claude 4 Sonnet？

来自主题: AI技术研报

7709 点击 2025-06-10 15:28

DeepSeek-R1 发布，性能对标 OpenAI o1 正式版，实测编程性能直逼claude 4

今天，我们正式发布 DeepSeek-R1，并同步开源模型权重。DeepSeek-R1 遵循 MIT License，允许用户通过蒸馏技术借助 R1 训练其他模型。DeepSeek-R1 上线API，对用户开放思维链输出，通过设置 `model='deepseek-reasoner'` 即可调用。

来自主题: AI资讯

10076 点击 2025-05-28 21:49

超越OpenAI、ElevenLabs，MiniMax新一代语音模型屠榜！人格化语音时代来了

国产大模型进步的速度早已大大超出了人们的预期。年初 DeepSeek-R1 爆火，以超低的成本实现了部分超越 OpenAI o1 的表现，一定程度上让人不再过度「迷信」国外大模型。

来自主题: AI技术研报

10841 点击 2025-05-16 09:59

刚刚，DeepSeek 开源 DeepSeek-Prover-V2-671B 新模型

就在刚刚，DeepSeek 在全球最大 AI 开源社区 Hugging Face 发布了一个名为 DeepSeek-Prover-V2-671B 的新模型。

来自主题: AI资讯

9984 点击 2025-04-30 20:41

业内首次! 全面复现DeepSeek-R1-Zero数学代码能力，训练步数仅需其1/10

OpenAI 的 o1 系列和 DeepSeek-R1 的成功充分证明，大规模强化学习已成为一种极为有效的方法，能够激发大型语言模型（LLM) 的复杂推理行为并显著提升其能力。

来自主题: AI技术研报

8528 点击 2025-04-23 14:04

扩散LLM推理用上类GRPO强化学习！优于单独SFT，UCLA、Meta新框架d1开源

当前，强化学习（RL）方法在最近模型的推理任务上取得了显著的改进，比如 DeepSeek-R1、Kimi K1.5，显示了将 RL 直接用于基础模型可以取得媲美 OpenAI o1 的性能不过，基于 RL 的后训练进展主要受限于自回归的大语言模型（LLM），它们通过从左到右的序列推理来运行。

来自主题: AI技术研报

7252 点击 2025-04-22 08:39

全国产算力！一手实测科大讯飞推理模型星火X1，与R1不相上下？

就在昨天，深耕语音、认知智能几十年的科大讯飞，发布了全新升级的讯飞星火推理模型 X1。不仅效果上比肩 DeepSeek-R1，而且我注意到一条官方发布的信息——基于全国产算力训练，在模型参数量比业界同类模型小一个数量级的情况下，整体效果能对标 OpenAI o1 和 DeepSeek R1。

来自主题: AI资讯

10445 点击 2025-04-22 08:29

推理模型其实无需「思考」？伯克利发现有时跳过思考过程会更快、更准确

当 DeepSeek-R1、OpenAI o1 这样的大型推理模型还在通过增加推理时的计算量提升性能时，加州大学伯克利分校与艾伦人工智能研究所突然扔出了一颗深水炸弹：别再卷 token 了，无需显式思维链，推理模型也能实现高效且准确的推理。

来自主题: AI技术研报

8698 点击 2025-04-19 14:39

AI资讯新闻榜单内容搜索- DeepSeek-

为什么 DeepSeek 大规模部署很便宜，本地很贵

对谈 DeepSeek-Prover 核心作者辛华剑：Multi Agent 天然适合形式化数学 ｜Best Minds

1.93bit版DeepSeek-R1编程超过Claude 4 Sonnet，不用GPU也能运行

DeepSeek-R1 发布，性能对标 OpenAI o1 正式版，实测编程性能直逼claude 4

超越OpenAI、ElevenLabs，MiniMax新一代语音模型屠榜！人格化语音时代来了

刚刚，DeepSeek 开源 DeepSeek-Prover-V2-671B 新模型

业内首次! 全面复现DeepSeek-R1-Zero数学代码能力，训练步数仅需其1/10

扩散LLM推理用上类GRPO强化学习！优于单独SFT，UCLA、Meta新框架d1开源

全国产算力！一手实测科大讯飞推理模型星火X1，与R1不相上下？

推理模型其实无需「思考」？伯克利发现有时跳过思考过程会更快、更准确

对谈 DeepSeek-Prover 核心作者辛华剑：Multi Agent 天然适合形式化数学｜Best Minds